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基于 最 短 长 链接 优先 选择 的 VLSI 阵列 重 构 算 法 
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摘 要 :为 了 提高 超大 规模 集成 逻辑 阵列 的 重 构 效 率 ,提出 一 种 基于 最 短 长 链接 优先 选择 原则 的 改进 算法 。 该 算法 从 阵列 
2 端 分 别 构建 逻辑 列 ,直到 2 条 逻辑 列 相交 , 则 停止 构建 逻辑 列 。 在 2 条 相交 逮 辑 列 作为 边界 的 局 部 区 域内 ,以 从 上 到 下 的 
方式 寻找 每 行 长 链接 最 短 的 处 理 器 单元 ,所 选取 的 处 理 单元 用 于 构建 局 部 最 优 的 逻辑 列 。 基 于 上 述 操作 ,利用 分 治 思 想 ， 
将 新 获得 的 逻辑 列 作为 新 的 局 部 区 域 的 边界 ,依次 迭代 获得 新 的 局 部 最 优 逻 辑 列 。 最 后 ,将 所 得 到 的 局 部 最 优 逻辑 列 连接 
起 来 , 即 可 获得 最 终 的 目标 阵列 。 通 过 与 现 有 的 重 构 算法 的 比较 分 析 , 验证 了 算法 的 高 效 性 。 仿 真 结果 表明 ,在 保证 逻辑 
县 列 规模 不 变 的 条 件 下 , 相 较 于 现 有 的 重 构 算法 ,该 算法 能 够 有 效 减 少 阵列 重 构 过 程 中 处 理 器 的 访问 数 ,并 能 在 一 定 程度 
由 降低 重 构 的 运行 时 间 ,提高 逻辑 阵列 的 重 构 效 率 。 
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”Reconstruction algorithm for VLSI array with the priority selection of the 
shortest long interconnect 
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aAsbstract: In order to improve the reconstruction efficiency of the very large-scale integrated logic array, an improved algo- 


m based on the principle of first selecting the shortest and long interconnect is proposed. This improved algorithm con- 

tructs logical columns from both ends of the array until the two logical columns intersect, then stops constructing logical 

“olumns. In the local area with two intersecting logical columns as the boundary, the processor unit with the shortest link 

= hgth of each row is searched from top to bottom, and the selected processing unit is used to construct the locally optimal 
legical column. Based on the above operations, using the idea of divide and conquer, the newly obtained logical column is 
used as the boundary of the new local area, and the new local optimal logical column is obtained in turn. Finally, connect the 
obtained local optimal logical columns to obtain the final target array. Through comparison and analysis with existing recon- 
struction algorithms, the efficiency of the proposed algorithm is verified. The final simulation results show that under the 
condition that the scale of the logic array remains unchanged, compared with the existing reconstruction algorithm, this 
improved algorithm can effectively reduce the number of processor accesses during the array reconstruction process, and to a 
certain extent, the running time of the reconstruction is reduced, and the reconstruction efficiency of the logic array is im- 
proved. 
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随 着 超大 规模 集成 (VLSI 技术 和 唱 圆 规模 集成 VLSI 阵列 发 生 故 障 的 概率 也 随 之 增加 ,从 而 导致 处 
(WSI 技术 的 发 展 ,集成 系统 得 以 在 芯片 上 构建 。 然 。 理 器 的 计算 能 力 和 稳定 性 受到 影响 ,进而 影响 整个 集 
而 , 随 着 VLSI 阵列 中 处 理 单元 (PE) 密 度 的 增加 ， ”成 系统 的 正常 工作 。 因 此 ,需要 采用 容错 技术 对 阵列 
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进行 重 构 来 提高 阵列 的 可 靠 性 。 
网 络 拓扑 结构 的 VLSI 重 构 技术 主要 有 元 余 法 
和 降 阶 法 中 2 种 。 在 宛 余 法 中 ,集成 系统 存在 部 分 备 
用 的 处 理 单元 , 当 系 统 中 出 现 故障 处 理 单元 时 ,可 用 
备用 的 处 理 单元 对 故障 的 处 理 单元 进行 替换 ;在 降 阶 
法 中 ,系统 的 元 件 均 以 统一 的 方式 进行 处 理 , 无 额外 
的 备用 元 件 ,这 种 方法 使 用 阵列 中 尽 可 能 多 的 无 故障 
处 理 单元 来 重 构 目 标 阵 列 ,从 而 提高 无 故障 处 理 单元 
的 使 用 效率 。 
在 过 去 的 几 十 年 间 , 二 维 处 理 器 阵列 的 重 构 策略 
被 广泛 研究 。Kuo 等 外 提出 了 二 维 处 理 器 阵列 下 3 
种 路 由 重 构 方案 :1) 行 、 列 旁 路 ;2) 行 旁 路 和 列 重 路 
由 ;3) 行 . 列 重 路 由 ,同时 证 明了 阵列 的 重 构 问 题 是 
NP 完全 问题 。Low 等 ”用 GCR 算法 构建 包含 所 选 
行 风 最 大 目标 阵列 。 基于 片上 网 络 阵 列 , Xiang 等 上 
提出 了 一 种 新 的 用 于 全 网 单 播 组 播 核 心 测试 的 传输 
窟 错 路 由 算法 ,并 基于 重 和 至 虚拟 网 络 策略 ,提出 了 片 
网 络 无 死 锁 自 适应 路 由 方案 ;此 外 ,Xiang 等 加 提 
出 子 一 种 高 性 能 自 适应 路 由 策略 ,有 效 降低 了 芯片 网 
络 的 功 耗 ;基于 重复 转向 模型 , Cai 等 四 提出 了 基于 
天 完 锁 自 适应 方案 的 三 维 片上 网 络 路 由 算法 。 重 构 
方案 主要 从 时 间 、 规 模 、 内 部 链接 长 度 等 方面 对 阵列 
进 得 优化。 在 降低 阵列 重 构 时 间 方 面 , Wu 等 中 用 并 
行 区 法 减少 阵列 的 构建 时 间 ; Qian 等 四 提出 了 一 种 
智能 搜索 算法 ,有 效 提 升 了 阵列 的 重 构 效 率 ; Qian 
等 吧 提 出 了 一 种 可 满足 最 大 功率 效率 VLSI 阵列 重 
构 较 有 效 方 法 。 在 减少 阵列 长 连接 方面 , Srikanthan 
等 ge 通过 重 构 紧 耦合 目标 阵列 优化 了 阵列 的 长 连 
按 省 汉 鹏 等 "设计 了 紧 烛 合 阵列 的 整数 规划 模型 ， 
Qian 等 "3 提 出 了 一 种 构造 高 性 能 VLSI 子 阵列 的 有 
效 多 重 最 短 增 广 路 径 算法 ; 黄强 胜 等 25 利用 网 络 流 
模型 减少 阵列 的 连接 长 度 。 在 扩大 阵列 规模 方面 , 王 
意 注 等 中 基于 整数 规划 思想 获取 了 最 大 规模 阵列 ; 
Qian 等 9 在 行 和 列 重 路 由 方案 下 重 构 了 VLSI 子 阵 
列 的 数学 模型 ;Ding 等 "9 提 出 了 在 行 和 列 重 路 由 下 
重 构 二 维 网 格 连接 VLSI 子 阵 列 的 灵活 方案 ; Qian 
等 nL" 利用 网 络 流 算法 对 阵列 进行 优化 ,并 提出 了 一 
种 新 的 算法 ,扩大 了 阵列 的 规模 。 白 章 顺 等 9 提出 
了 一 种 容错 处 理 器 阵列 的 重 构 抽 象 模型 ;胡佳 等 
提出 了 一 种 高 性 能 阵列 重 构 的 SAT 描述 模型 ; Wu 
等 中 将 阵列 的 研究 从 二 维 阵列 向 三 维 阵 列 延伸 ; 
Jiang 等 [中 提出 了 一 种 高 效 的 重 构 算法 ,降低 了 三 维 
阵列 中 的 连接 长 度 ;Jiang 等 9 在 取消 限制 补偿 距离 
的 条 件 下 提出 的 FLX 算法 进一步 扩大 了 获取 的 阵列 
规模 ,并 在 FLX 算法 的 基础 上 ,基于 分 治 策略 的 思 


想 ,提出 了 RIL 算法 ,减少 了 阵列 中 的 长 链接 数 。 然 
而 ,由 于 RIL 算法 在 重 构 逻辑 列 的 过 程 中 需要 对 局 
部 区 域内 所 有 的 节点 进行 访问 ,在 一 定 程度 上 影响 了 
阵列 的 重 构 时 间 , 降 低 了 重 构 效 率 。 因 此 ,为 了 减少 
构建 阵列 过 程 中 对 节点 的 访问 数 ,加 快 阵列 的 重 构 速 
度 , 在 RIL 算法 的 基础 上 ,提出 了 一 种 基于 最 短 长 链 
接 优先 选择 原则 的 重 构 (Cacceleration of RIL, 简称 
ACRIL) 算 法 。 


1 二 维 阵 列 


结构 与 问题 描述 


1.1 阵列 结构 


在 二 维 VLSI 阵列 中 ,制造 产生 的 原始 阵列 用 五 
表示 ,阵列 大 小 为 m Xn, 其 中 尺 n 分 别 为 原始 阵列 
的 行 数 和 列 数 。 假 设 p 为 原始 阵列 的 故障 密度 ,0 三 
Pp 三 1, 则 原始 阵列 中 出 现 故 障 的 处 理 单元 的 个 数 N 
表示 为 N= 二 (1 一 p) Xm Xn。 故 障 的 处 理 单元 表示 
不 能 对 数据 进行 处 理 或 者 从 其 他 处 理 单元 获取 数据 
的 处 理 单元 。 原 始 阵 列 经 过 重新 配置 后 获得 的 阵列 
称 为 逻辑 阵列 ,用 工 表 示 , 阵 列 大 小 为 m' Xn’ lm’ 三 
m,n 过 n) ,逻辑 阵列 中 不 包含 故障 的 处 理 单元 。 原 
始 阵 列 和 逻辑 阵列 中 的 行 ( 列 ) 分 别称 为 物理 行 ( 列 ) 


和 逻辑 行 ( 列 )。 原 始 阵 列 的 物理 结构 如 图 1 所 示 。 
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1 VLSI 阵列 体系 结构 


每 个 开关 有 4 种 链 路 状态 。 每 个 处 理 单元 都 可 
通过 改变 路 由 开关 的 链接 状态 来 改变 处 理 单元 之 间 
的 连接 方式 。e;,; 、e 分 别 为 物理 阵列 .逻辑 阵列 中 
处 于 位 置 (i,j ) 的 处 理 单元 ,其 中 i 为 处 理 单元 的 行 
号 ,j 为 处 理 单元 的 列 号 。 原 始 阵列 有 2 种 基本 的 重 
构 方 案 ,分别 是 行 旁 路 方案 和 列 重 路 由 方案 。 在 行 旁 
路 方案 中 ,e;,; 1 可 直接 通过 改变 内 部 开关 连接 状 
态 , 绕 过 故障 的 处 理 单元 e;,; ,直接 与 e;,; ,1 相连 , 同 
理 , 列 旁 路 方案 的 定义 与 之 类 似 。 在 列 重 路 由 方案 
中 ,e; 1,; 为 故障 处 理 单 元 ,可 通过 外 部 开关 直接 连 
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接 到 e;, ,其 中 |j 一 ;| 二 4 ,a 为 补偿 距离 ,通常 限制 
为 1, 从 而 能 够 有 效 保证 硬件 实现 低 功 耗 。 同 理 , 行 
重 路 由 方案 的 定义 与 之 类 似 。 

根据 补偿 距离 的 定义 ,每 个 处 理 单元 的 上 相 邻 节 
点 集合 和 下 相 邻 节点 集合 分 别 记 为 A_ (zx)、A+ Qu)， 
且 定 义 如 下 : 

定义 1 对 于 行 中 的 每 个 无 故障 处 理 单元 ， 

DA_()= 二 {fv:vE R,_1,v 为 无 故障 处 理 单元 ， 
且 | col(zx) 一 col(o) | 1}) ,2<i<m., 

2)A, (Co)={o:oER io 为 无 故障 处 理 单元 ， 
且 | col(z) 一 col(o) | 1} ,1< 入， 一 1。 

3) 对 于 任意 的 vwEA+; (w) (A_ (ww)), 当 col(w) 一 
col(o) 三 一 1 时 ,v 称 为 x 的 左下 (上 ) 邻 接 处 理 单元 ; 
涛 01() 一 col(v) 二 0 时 ,v 称 为 wu 的 中 下 (上 ) 邻 接 
处 疆 单 元 ; 当 col(w) 一 col(v) 二 1 时 ,wv 称 为 wu 的 右 下 
(人 邻接 处 理 单元 。 

一 个 二 维 旬 辑 阵 列 有 6 种 可 能 的 链 路 方式 ,根据 
链 器 使 用 的 开关 数 , 可 分 为 短 连 接 与 长 连接 。 只 使 用 
二 人 金 开 关 来 连接 目标 阵列 中 的 处 理 单元 的 链 路 方式 
称 为 短 连接 , 而 使 用 2 个 开关 的 链 路 方式 称 为 长 


连接 。 
) 定 义 2 长 连接 数量 最 少 的 阵列 称 为 高 性 能 逻 
辑 阵 列 (HPTA)。 


182 问题 描述 


(在 行 旁 路 和 列 重 路 由 条 件 下 对 二 维 处 理 器 阵列 
的 重 构 问题 进行 研究 ,研究 内 容 包括 寻找 高 性 能 的 无 
故障 目标 阵列 。 

问题 1 给 定 一 个 规模 大 小 为 m Xn 的 带 有 故 
障 节点 的 网 状 连接 处 理 器 阵列 ,找到 长 链接 数目 最 小 
的 无 故障 高 性 能 目标 阵列 。 


2 ”ACRIL 算法 介绍 


RIL 算法 通过 运用 分 治 策略 的 思想 解决 了 不 限 
制 补 偿 距离 条 件 下 的 问题 1。 为 了 优化 RIL 算法 的 
效率 ,采用 ACRIL 算法 ,通过 减少 对 无 故障 节点 的 
访问 次 数 , 重 构 局 部 优化 逻辑 列 , 以 降低 逻辑 阵列 的 
重 构 时 间 。 

ACRIL 算法 的 求解 结果 如 图 2 所 示 。 该 算法 主 
要 分 为 3 个 子 过 程 :Up_Process 表示 第 一 个 公共 处 
理 单元 到 第 一 行 的 子 逻 辑 列 求解 过 程 ; Down_ 
Process 表示 最 后 一 个 公共 处 理 单元 到 最 后 一 行 的 子 
逻辑 列 求解 过 程 ;Shest_Process 表示 公共 处 理 单元 
之 间 的 子 逻 辑 列 求解 过 程 。 图 2 中 的 数字 表示 处 理 
单元 的 长 连接 。 


图 2 ACRIL 算法 的 求解 结果 


ACRIL 算法 的 整体 思路 如 下 : 

1) 在 一 次 迭代 过 程 中 ,找到 左右 2 条 逻辑 列 的 交 
点 ,并 将 交点 放 和 人 交点 集合 中 。 

2) 利 用 智能 搜索 算法 分 别 求解 Up_Process、 
Down_Process 及 Shest_Process 三 个 子 过 程 , 每 个 子 
过 程 获得 一 段 路 径 。 

3) 将 这 3 个 子 过 程 获得 的 路 径 进 行 合 并 ,得 到 一 
条 完整 的 路 径 ,此 路 径 即 是 所 要 求 的 一 条 逻辑 列 。 

4) 将 新 获取 的 逻辑 列 作 为 新 的 边界 ,继续 重 构 逻 
辑 列 ,重复 1)、2)、3) 过 程 。 

算法 1 ACRIL 算 法 

输入 :m Xn 的 原始 阵列 。 

输出 :zz X&k 的 目标 阵列 。 

1) 根 据 主 阵列 ,依次 分 别 从 左 至 右 和 从 右 至 左 的 
方式 重 构 逻 辑 列 。 

2) 直 到 从 2 个 方向 构建 的 逻辑 列 连接 到 相同 的 
节点 ,形成 公共 区 域 。 在 逻辑 列 的 公共 区 域 构建 具有 
最 短 长 连接 的 逻辑 列 。 

寻找 最 优 逻 辑 列 的 伪 代 码 如 下 : 
while 交点 集合 不 为 空 do 

for node u 和 代 第 一 行 元 素 do 
启发 式 搜索 算法 寻找 Up_Process 的 路 径 PP); 
for node u 儿 最 后 一 行 元 素 do 

启发 式 搜索 算法 寻找 Down_Process 的 路 径 P，; 

if 2 个 交点 相 邻 do 
直接 加 入 路 径 ; 


else 
启发 式 搜索 算法 思想 寻找 Shest_Process 的 路 


径 了 PP,; 
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将 3 个 部 分 获得 的 路 径 合并 形成 一 条 完整 的 路 
径 P=PiUP,UP，。 
3) 以 新 构建 的 逻辑 列 作为 新 的 边界 ,重复 步 又 
1) .2) ,直到 所 有 的 逻辑 列 构建 完毕 。 
Shest_Process 子 过 程 主要 运用 启发 式 搜索 思想 
进行 求解 ,其 求解 过 程 描述 如 下 : 
输入 :2 个 公共 节点 S、T。 
输出 :ST 之 间 的 一 段 路 径 P。 
了 DD) 设置 2 个 列表 ,分 别 为 开放 列表 与 关闭 列表 。 
2) 遍 历 节点 ,计算 当前 节点 的 权 值 , 根 据 情 况 将 
节点 放 和 人 相应 的 列表 中 ; 当 节 点 已 位 于 开放 列表 时 ， 
重新 计算 权 值 。 
3) 当 开放 列表 为 空 时 ,表示 子 过 程 执行 完毕 。 求 
解 竹 过程 的 伪 代 码 如 下 : 
| 襄 开 放 列 表 , 只 包含 S; 
四 关闭 列表 : 空 集 ; 
while 开放 列表 不 为 空 do 
获取 开放 列表 中 权 值 最 小 的 节点 作为 当前 节点 ; 
让 当前 节点 为 了 then 
return S 和 了 之 间 的 路 径 也 ; 
将 当前 节点 放 入 关闭 列表 中 ; 
while 当前 节点 的 下 邻接 集合 不 为 空 do 
获取 下 邻接 节点 ui; 
if wu € 开放 列表 do 
重新 计算 w 的 权 值 ; 
if wu € 关闭 列表 do 
不 用 执行 任何 操作 ; 
else 
计算 x 的 权 值 ,将 wx 放 入 开放 列表 ; 
从 下 邻接 集合 中 去 除 v。 
Up_Process 和 Down_Process 子 过 程 的 求解 方 
式 与 子 过 程 Shest Process 类 似 。 


3 实验 与 分 析 


为 验证 ACRIL 算法 的 有 效 性 ,用 C 十 十 语言 实 
现 了 该 算法 ,还 原 了 现 有 的 重 构 算法 RIL, 并 将 2 种 
重 构 算法 进行 对 比 。 为 保证 实验 数据 具有 可 比 性 和 
可 靠 性 ,2 种 重 构 算法 均 在 相同 的 实验 环境 下 运行 。 
执行 程序 的 实验 配置 环境 为 Inter® Core™ 3.10 
GHz 的 CPU 和 8 GiB RAM, 操作 系统 为 
Windows 10。 

RIL 算法 与 ACRIL 算法 的 访问 节点 数 的 对 比 
如 图 3 所 示 。 图 3 中 ,在 64X64 规模 下 的 原始 阵列 
的 错误 率 分 别 设置 为 1%、5%、10%、15%。 从 图 3 
可 看 出 ,在 错误 率 为 1% 的 原始 阵列 中 ,RIL 算法 对 
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阵列 中 的 节点 访问 数 为 5 091, 而 ACRIL 算法 对 阵 
列 中 的 节点 访问 数 为 3 989; 在 错误 率 为 10% 的 原始 
阵列 中 ,RIL 算法 对 阵列 中 的 节点 访问 数 为 5 191 ,而 
ACRIL 算法 对 阵列 中 的 节点 访问 数 为 3 573。2 种 
重 构 算 法 的 实验 数据 比较 结果 表明 , 相 较 于 现 有 的 重 
构 算法 RIL, ACRIL 算法 能 在 一 定 程度 上 减少 阵列 
在 重 构 逻 辑 列 的 过 程 中 对 节点 的 访问 数 ,提高 阵列 的 
重 构 效 率 。 
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3 ”RIL 与 ACRIL 算法 的 访问 节点 数 对 比 


RIL 算法 与 ACRIL 算法 性 能 指标 如 表 1 所 示 。 
从 表 1 可 看 出 ,两 者 在 相同 错误 率 条 件 下 都 可 获取 相 
同 规模 的 目标 逻辑 阵列 , 且 相 比 于 RIL 算法 ,ACRIL 
算法 的 阵列 重 构 时 间 更 短 , 这 表明 阵列 从 故障 状态 恢 
复 的 效率 更 高 。 例 如 ,在 错误 率 为 1%、 规 模 为 32 Xx 
32 的 原始 阵列 中 ,RIL 算法 的 重 构 时 间 为 674 ms, 而 
ACRIL 算法 的 重 构 时 间 为 574 ms, 重 构 效 率 提 高 了 
14. 83%; 在 错误 率 为 5%, 规 模 为 48X48 的 原始 阵 
列 中 ,RIL 算法 的 重 构 时 间 为 956 ms, 而 ACRIL 算 
法 的 重 构 时 间 为 821 ms, 重 构 效 率 提高 了 14. 13%。 
这 表明 ACRIL 算 法 的 运行 性 能 明显 优 于 RIL 算 法 。 


表 1 RIL 与 ACRIL 算法 的 性 能 指标 


原始 阵列 ”错误 率 / 目标 阵列 重 构 时 间 /ms 重 构 
规模 % 规模 RIL ACRIL ”效率 /% 

1 32X31 674 574 14. 83 

32X32 5 32X27 641 554 13. 57 
10 32X23 614 529 13.84 

1 48X45 1037 926 io.70 

48X48 5 48X42 956 821 14. 13 
10 48X 36 870 782 i 

64X61 2 281 2.078 8. 90 

64X 64 5 64X55 2 118 1 926 9.10 
10 64X50 1 995 1 801 9.72 

4 结束 语 


基于 现 有 的 重 构 算 法 ,提出 了 一 种 通过 减少 处 理 
单元 的 访问 次 数 ,进一步 提高 原始 阵列 重 构 速度 的 方 
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